import pandas as pd
import numpy as np


# 读取 Excel 文件
excel_file = pd.ExcelFile('./data/2024内蒙种植合作社.xlsx')
df = excel_file.parse('Sheet1', header=1)


# 定义生产企业类型和对应的关键词
categories = {
    '肥料生产企业': ['肥料生产', '有机肥生产', '复合微生物肥料研发', '生物有机肥料研发', '有机无机复混肥料制造', '其他肥料制造', '复混肥料制造'],
    '农药生产企业': ['农药生产', '生物化学农药研发', '微生物农药研发'],
    '种子生产企业': ['主要农作物种子生产', '非主要农作物种子生产', '农作物种子生产', '种苗生产'],
    '农业机械生产企业': ['农业机械制造', '农林牧副渔业专业机械的制造'],
    '农膜生产企业': ['农膜生产', '新型膜材料制造'],
    '其他农资生产企业': []
}


# 定义一个函数来判断公司所属的生产企业类型
def classify_business(row):
    description = str(row['经营范围']) + ' ' + str(row['-.25'])
    for category, keywords in categories.items():
        if any(keyword in description for keyword in keywords):
            return category
    return '其他农资生产企业'


# 对每一行应用函数进行分类
df['生产企业类型'] = df.apply(classify_business, axis=1)

# 将结果保存为新的Excel文件
df.to_excel('2024内蒙种植合作社（含生产企业类型）.xlsx', index=False)